R語言_SMOTE不平衡數據

第 11 屆 iThome 鐵人賽

DAY 12

AI & Data

R語言 - 從「主觀感覺」轉為「客觀事實」系列第 12 篇

11th鐵人賽

yanchen

團隊為了紅布條

2019-09-27 18:19:39

2558 瀏覽

分享至

執行的時候有兩個地方要注意,一個是資料型態必須是data.frame(我平常都會轉成tibble看資料比較方便),另外一個就是你要改變的參數必須是一種factor,這兩個不轉不給使用SMOTE()

train_smote <- SMOTE(fraud_ind ~ ., as.data.frame(fraud_train), perc.over = 20000, perc.under=100)

然後SMOTE()的perc.over 跟 perc.under我覺得超級莫名其妙的啊哈哈。

perc.over = a 表示較少的變量變成原来的（1+a/100）倍
perc.under= b 表示較多的變量變成少變量的 b/100 * (a/100) 倍

也就是說如果我今天只是想要把較少的資料變成跟較多的資料差不多,我必須...

par = table(data$fraud_ind)[1]/table(data$fraud_ind)[2]
#知道差距幾倍
我的perc.over = a 必須是1+a/100 = par
a = (par - 1)*100
我的perc.over = b 必須是b/100 * (a/100) = par
b = par / (100 / a )*100 = par * a = par * (par - 1)*100

我的理解應該沒錯吧(?

R語言_一言不合就xgboost_2

R語言 - 資料不平衡_2

系列文

R語言 - 從「主觀感覺」轉為「客觀事實」共 30 篇

RSS系列文訂閱系列文

7 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

SAP B1 如何將"自定義表格"匯出並且匯入到另一個資料庫

SAP B1 如何將"自定義表格"匯出並且匯入到另一個資料庫

IT邦幫忙

R語言 - 從「主觀感覺」轉為「客觀事實」系列 第 12 篇